第7章 要約生成
ニュース記事から見出しを生成
解説が充実している(TODO まとめ)
抽出型要約
生成型要約
この章ではこちらで解く(7.2)
https://github.com/ghmagazine/llm-book/blob/b25eb17962ffd5d730296eebd1e919f136c5f8ea/chapter7/7-summarization-generation.ipynb
評価指標(7.3)
ROUGE
rouge-score
RecallのR
BLEU
sacrebleu
precision
BERTScore
bert-score
plot_exampleで日本語が豆腐にならずにきれいに出ている。手元では
japanize-matplotlib
を使った
BERTを使って意味を考慮
BERTScore算出例(『大規模言語モデル入門』)
データセット
llm-book/livedoor-news-corpus
事前学習済みT5
retrieva-jp/t5-base-long
探索アルゴリズム (7.5.1)
貪欲法
ビームサーチ
サンプリング (7.5.2)
temperatureが関わる!
top-k
top-p